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Résumé. Pour représenter l'évolution des espèces moléculaires dans un réseau de 
Qgènes, le modèle le plus classique est le processus de Markov à sauts. Ce modèle a l'in- 
^ convénient d'être long à simuler en raison de la rapidité et du grand nombre de réactions 
chimiques. Nous proposons des modèles approximatifs, basés sur les processus détermi- 
ÇNlnistes par morceaux, permettant de raccourcir les temps de simulation. Dans un article 

, récent, nous avons montré rigoureusement la convergence des premiers modèles (proces- 

P^sus de Markov à sauts) vers les seconds (processus déterministes par morceaux). Dans 
'exposé, nous n'entrerons pas dans les détails de cette justification rigoureuse, mais nous 
J montrerons des exemples d'application à des réseaux de gènes très simples (modèle de 
cdCook et modèle du pliage Lambda). 

, ^, Mots-clés. Réseau de gènes, Processus déterministes par morceaux, Processus de 
Markov à sauts, Simulation. 
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Abstract. The molecular évolution in a gene regulatory network is classically modeled 
^ by Markov jump processes. However, the direct simulation of such models is extremely 

jtime consuming. Indeed, even the simplest Markovian model, such as the production 

module of a single protein involves tens of variables and biochemical reactions and an 
équivalent number of parameters. We study the asymptotic behavior of multiscale sto- 
. .chastic gene networks using weak limits of Markov jump processes. The results allow us to 
.^propose new models with reduced exécution times. In a new article, we have shown that, 
^Sdepending on the time and concentration scales of the system, the Markov jump processes 
Cjcould be approximated by piecewise deterministic processes. We give some applications 
of our results for simple gene networks (Cook's model and Lambda-phage model). 

Keywords. Gene networks, Piecewise deterministic processes, Markov jump pro- 
cesses, Simulation. 



1 Présentation du problème 

En biologie moléculaire, les réseaux de gènes sont définis par un ensemble de réactions 
chimiques entre les espèces moléculaires présentes dans une cellule considérée. Il est main- 
tenant établi que la dynamique de ces réseaux est stochastique : les systèmes de réactions 
chimiques sont modélisés par des processus de Markov à sauts homogènes. 
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Soit un ensemble de réactions chimiques notées R r , pour r G ÎJ; l'ensemble 7Z est 
supposé fini. Ces réactions modifient les quantités d'espèces moléculaires présentes dans 
la cellule. Chaque espèce moléculaire est notée i, pour % G S — {1, . . . , M}. Le nombre 
de molécules de l'espèce moléculaire i est noté rij et l'état du système est décrit par le 
vecteur X = (ni, . . . ,Um) £ N M . Chaque réaction R r change l'état du système de la 
manière suivante : I 4 I + 7,, avec 7 r G Z M . Le vecteur / ~f r est le saut associé à la 
réaction R r . La réaction R r a lieu avec un taux X r (X) qui dépend de l'état du système. 

Cette évolution est décrite par un processus de Markov à sauts. Les instants de sauts, 
notés (Tj)j>i vérifient T = 0, Tj — T\ + • • • + Tj, où (r k ) k >i est une suite de variables 
aléatoires indépendantes et telles que 

P(r, > t) = exp ( - K(X(T^i))?j . 

À (X(T )) 

Au temps Tj, la réaction r G 1Z a lieu avec probabilité — — — et l'état du 

J2K(X(T i _i)) 

reTZ 

système change selon l'équation X — > X + 7 r , c'est-à-dire : 

X(T i )=X(T i _ 1 )+ lr . 

Ce processus de Markov a pour générateur : Af(X) = J2 r en [/(-^ + 7»*) — f(X)] \(X), 
pour des fonctions / appartenant au domaine du générateur. 

Ces modèles de Markov à sauts ont des temps d'exécution très longs. Par exemple, 
même un simple réseau de gènes contient des dizaines de variables et de paramètres. Nous 
avons montré (Crudu et al. (2007) ; Radulescu et al. (2012)) que ces modèles pouvaient être 
approchés (via des convergence en loi (Billingsley (1999)) par des processus markoviens 
déterministes par morceaux. Ces modèles approchés ont amélioré les temps d'exécution. 



2 Nos résultats 

Dans les applications, les nombres de molécules sont de différentes échelles : certaines 
espèces sont en grand nombre, et d'autres en faible nombre. En conséquence, nous avons 
décomposé l'ensemble des espèces en deux sous-ensembles, notés C et D de cardinaux 
Me et Md. De même, l'état du système est noté X = (Xc,Xd), et les sauts notés 
7r = (iri !?)■ Pour i G D, ni est d'ordre 1, tandis que pour i G C, ni est proportionnel 
k N où N est grand. Nos résultats asymptotiques correspondent à N — > +00. Notons 

également xc = J^-^-c et x = (xc,Xd). De même, l'ensemble des réactions se décompose 
suivant les espèces mises en jeu dans les réactions : 1Z = TZd U IZc U TZdc- Une réaction 
dans TZd (resp. IZc) produit ou consomme uniquement des espèces rares, c'est-à-dire de 
D (resp. des espèces fréquentes, c'est-à-dire de C). De même, les taux de réaction dans 
TZd (resp. IZc) dépendent uniquement de Xp (resp. xc). Une réaction dans TZdc a un 
taux qui dépend à la fois de ï c et X D et produit ou consomme des espèces à la fois rares 
(D) et fréquentes (C). 
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Les taux des réactions r G TZc sont également grands et d'ordre N, et nous posons 
À r = ^. Ceci signifie que la variable fréquente Xq est fréquemment impliquée dans des 
réactions chimiques. Supposons pour l'instant que les réactions dans IZd ou IZdc ont un 
taux d'ordre 1. 

Ces nouvelles variables obtenues par changement d'échelle obéissent encore à un pro- 
cessus de Markov à saut, dont le générateur est : 



Âf(x c ,X D ) 



E 

relie 



f(x c + ^,X D )-f(x c ,X D ) 



N~\ r (x c ) 



+ E 

r&lDC 



f{x c + - 7r C , X D + 7r D ) - f{x c , X D ) 



\ r (x c ,X D ) 



+ J2 [f(x C ,X D + rf)-f(x c ,X D )}\ r (X D ). 

re1Z D 

Si N — > +00, Kurtz (1971,1978) a montré que les espèces rares et les espèces fréquentes 
se découplent, c'est-à-dire obéissent à des processus qui leur sont propres. En effet, les 
réactions dans TZdc ne sont pas suffisamment fréquentes pour changer le comportement 
de la variable rapide xc- A la limite, la variable xq obéit à un système différentiel, qui 
fonctionne sans influence de la variable discrète Xj> La variable discrète Xd, quant à elle, 
obéit à un processus de sauts, indépendant de la variable continue Xq- 

Notre travail a été de considérer des système plus généraux contenant d'autres types 
de réactions, et aboutissant à d'autres systèmes limites. Selon les différentes échelles de 
temps de réactions et de concentration des espèces, nous avons démontré rigoureusement 
quatre types de limites pour le processus de Markov à sauts : des processus continus et 
déterministes par morceaux (Davis (1993)), des processus déterministes par morceaux avec 
des sauts sur la variable 'continue', des processus déterministes par morceaux moyennés, 
et des processus déterministes par morceaux avec des sauts singuliers sur la variable 
'continue'. 



3 Illustration 

3.1 Le phage A 

Le phage À est un parasite de la bactérie E.Coli. L'état du phage À est donné par 
le vecteur X = (C, C 2 , D, D\, D 2 ), où C et C\ représentent une protéine et son dimère, 
produits par le phage, et D, D±, D 2 représentent des sites promoteurs sur l'ADN du phage, 
respectivement non occupés, en simple ou en double occupation. Nous avons D + D\ + 
D 2 =constante. Le phage se développe au sein de la bactérie E. Coli selon les réactions 

chimiques suivantes : 2C è C 2 , D + C 2 S D 1} D 1 + C 2 % D 2 , D 1 % D 1 + nC, C 

k-l k- 2 

La dernière équation signifie qu'une protéine C meurt. 

Si les espèces moléculaires sont en grands nombres et ont des sauts rapides (ce qui se 
vérifie par certaines conditions sur les constantes cinétiques ki), nous pouvons approcher la 
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trajectoire de X t par une trajectoire déterministe. Les fluctuations autour des trajectoires 
déterministes sont illustrées dans la figure [H a). 




2000 4000 2000 4000 \ 2000 4000 2000 4000 

temps temps a ) temps temps 



FIGURE 1 - Modèle de phage À, la limite déterministe est marquée en trait continu, a) 
molécules et sites en grands nombres ; b) un seul site. Les paramètres sont a) kf = kf = 
kf = 0.1, k 4 = 0.006, h = 0.01 b) kf = kf = 0.01, fc 4 = 0.3, k 5 = 0.005. 



En réalité, toutes les molécules ne sont pas en grand nombre, car D, D\, D2 valent soit 
soit 1. Dans la figure [î]b) nous avons simulé des trajectoires sous cette hypothèse. Les 
processus déterministes par morceaux sont des bonnes approximations pour les trajec- 
toires de C, Ci- En effet, les molécules C, C 2 sont en grand nombre, on peut leur appliquer 
la limite déterministe entre deux sauts des variables discrètes. L'évolution de (D, D\) peut 
être décrite par un processus de Markov à sauts sur l'ensemble {0, l} 2 . Lorsque le site est 
non occupé ou en double occupation D = 1, D 1 = ou D = 0, D\ = 0, il n'y a pas de 
production de C qui tend à s'équilibrer avec son dimère. Lorsque le site est en simple occu- 
pation D = 0, D\ = 1 il y a production de C. Le caractère déterministe par morceaux de 
la dynamique des variables C, C2 ne signifie pas que les fluctuations de ces variables sont 
absentes. Bien au contraire, ces variables sont soumises à des fluctuations importantes 
(Fig. [î]b). Cette possibilité conduit a une conclusion biologique : la source des fluctua- 
tions n'est pas nécessairement la petitesse du nombre moyen de molécules observées mais 
pourrait être la petitesse du nombre de sites. 



3.2 Modèle de Cook 

Le modèle de Cook modélise les phénomènes de haploinsuffisance (invalidité de la 
moitié du nombre total de copies d'un gène). Il peut être décrit par le système de réactions 

suivant : G È G*, G* % G* + P, P % ■ 

k-i 

Dans le modèle de Cook G, G* sont des versions dormante et active d'un gène, P est 
la protéine traduite. 

Ce système de réactions conserve la quantité G + G* = Gq. Le régime de haploin- 
suffisance est défini par une faible valeur Gq. Pour simplifier considérons Go = 1, ce qui 
signifie une seule copie valide du gène. Dans cette situation G, G* G {0, 1}. Plus générale- 
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ment, le modèle de Cook pourrait décrire d'autres cas d'activité intermittente en biologie 
moléculaire. Par exemple, dans le fonctionnement de voies de signalisation, G, G* peuvent 
être considérées comme des variables cachées à deux valeurs paramètrisant la dynamique 
d'un système moléculaire dans deux situations (présence et absence d'une molécule clé). 
Des extensions sont possibles à des variables cachées à plusieurs valeurs discrètes (le 
comportement du système pourrait dépendre de la présence et de l'absence de certaines 
molécules). 

Si les paramètres cinétiques fcj vérifient certaines conditions, et si le nombre de molé- 
cules P est grand, on peut considérer que la dynamique de P est déterministe pour une 
valeur de G* fixée. On arrive au modèle déterministe par morceaux suivant : 



dP 
~dt 



-k 3 P + k 2 G*(t) 



où G*(t) est un processus de Markov à espace d'états E = {0, 1} et fonction d'inten- 
sité : 

ki si G* = 
fc_i si G* = 1 ' 



A (G* 



Une trajectoire est simulée sur la figure [2j 






FIGURE 2 - Modèle de Cook. Les paramètres sont k\ = 20, k-i = 10, k 2 = 4000, k 3 — 1. 



4 Conclusion 

- Les simulations précédentes montrent que les temps d'exécutions des modèles dé- 
terministes par morceaux sont bien plus courts que ceux des modèles de Markov à 
sauts. En effet, il n'est plus nécessaire de simuler TOUTES les réactions chimiques, 
et donc TOUS les sauts du processus markovien. L'approximation déterministe par 
morceaux, justifiée théoriquement dans notre article, est une alternative économique 
aux modèles markoviens de sauts. 

- Les trajectoires obtenues avec ces modèles approchés (les modèles déterministes par 
morceaux) sont similaires aux trajectoires obtenues en simulant toutes les réactions 
des modèles de Markov à sauts. 
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- Nous avons généralisé les résultats de Kurtz (1971,1978). En effet, Kurtz a proposé 
des modèles déterministes qui ne sont pas adaptés dans les situations où les espèces 
moléculaires conservent un comportement stochastique. Nos modèles, déterministes 
par morceaux, ont permis de palier à cette lacune. Les exemples du pliage À et de 
Cook illustrent ce point. 
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